"""
    使用xpath
    将html中的内容进行提取
"""

from lxml import html

def parse():
    # 读取文件中的内容
    file = open('./static/index.html', 'r', encoding='utf-8')
    s = file.read()

    selector = html.fromstring(s)

    # 解析 H3 的内容
    h3 = selector.xpath('/html/body/h3/text()')
    print(h3)

    # 解析 ul 的内容
    ul = selector.xpath('/html/body/ul/li')
    print(len(ul))
    for li in ul:
        print(li.xpath('text()'))

    # 解析 li 中 class 为 important 的内容
    li_important = selector.xpath('/html/body/ul/li[@class="important"]/text()')
    print(li_important)

    # 解析 a 的内容
    a = selector.xpath('/html/body/div[@id="container"]/a')
    # 标签内的内容
    print(a[0].xpath('text()'))
    # href属性
    print(a[0].xpath('@href'))

    # 解析最后一个p标签
    p = selector.xpath('/html/body/p[last()]/text()')
    print(p)

    file.close()


""" main方法，用于执行python文件 """
if __name__ == '__main__':
    parse()
